GPU as a Service(GaaS)
以云服务形态按需交付 GPU 算力的商业模式标签 — 是 算力租赁 业务的"云化包装",强调弹性、自助、按使用计费三个 SaaS 特征。
定义
GPU as a Service(GaaS / GPUaaS)是云计算服务模型在 AI 算力时代的延伸:用户不必采购 GPU 硬件,通过云界面或 API 即可申请 / 释放 GPU 资源、提交训练或推理任务、按实际使用时长付费。
与传统 IaaS 的关键差异是资源粒度 — GaaS 的最小单元是单卡或一组 NVLinked GPU(如一台 8x NVIDIA H100 节点 / 一台 GB200 NVL72),并预配了 AI 软件栈(CUDA、PyTorch、推理框架)。
GaaS 这一标签 2017 年由 Cirrascale、Lambda Labs 等独立 GPU 云首创,2022 年后随 CoreWeave 上市估值 $230 亿(据3-02)走向主流。
业务特征
- 弹性按时计费:$/GPU 小时(NVIDIA H100 全球 $2.4,中国 $5)
- 预装 AI 栈:CUDA / ROCm / PyTorch / 推理框架开箱即用
- 多种部署形态:独立 GPU 云、公有云 GPU 实例、私有化 GaaS 平台
- 目标客户:中小 AI 公司、研究机构、初创 AIGC 企业(自建集群门槛过高)
主要形态
| 形态 | 代表 | 特点 |
|---|---|---|
| 独立 GPU 云 / Neoclouds | CoreWeave / Nebius / Lambda Labs | 全栈自营,GPU 利用率优化 |
| 公有云 GPU 实例 | AWS EC2 P5 / 阿里云 PAI / Azure ND-series | 与生态打包 |
| 第三方转租 | 利通电子 / 中贝通信 | 多为长期合同 + 弹性混合 |
| 政府智算 GaaS | 北京 / 武汉 / 贵安智算中心 | 算力券补贴 |
在 AI 产业链中的角色
GaaS 是 3-02-AI算力租赁-智算服务 子行业的国际通用业务模式标签 — 中国玩家 利通电子 获 NVIDIA Preferred 合作伙伴资质就是对其 GaaS 能力的认证。GaaS 模式直接服务 4-02-模型工厂 中小客户和 4-04-模型部署与优化 推理负载。
关联
↑ up::2-01-核心逻辑芯片 2-02-AI服务器整机 ↓ down::4-02-模型工厂 4-04-模型部署与优化 ↔ related::算力租赁 智算服务 ∈ belongs_to::3-02-AI算力租赁-智算服务